سیستم تشخیص خودکار زبان صحبت شده از روی گفتار

پایان نامه
چکیده

تشخیص خودکار زبان در واقع مساله تشخیص زبان یک نمونه گفتار صحبت شده توسط سخنگوی نامعلوم است. تشخیص خودکار زبان می‏تواند به ارتباط بین مردم نواحی گوناگون کمک کند و کاربردهای مختلفی در توسعه گردشگری، تجارت آزاد، تقویت امنیت ملی از طریق پیش‏پردازش و فیلترنمودن مکالمات مشکوک، خدمات اورژانس، ترجمه همزمان در همایش‏ها و مکالمات بین‏المللی دارد. در این پایان‏نامه با کمک کلاسه‏بندی ویژگی‏های مختلف، سیستم تشخیص خودکار زبان، طراحی و پیاده‏سازی شده است. ویژگی‏های صوتی مورد نظر از فریم‏های متوالی سیگنال گفتار استخراج و ویژگی‏های آماری این فریم‏ها به عنوان بردار ویژگی در نظر گرفته می‏شوند. برای این منظور ویژگی‏های mfcc ، lpc وplp استخراج و مورد تجزیه و تحلیل قرا گرفته است. پس از استخراج این ویژگی‏ها، لیفترهای خطی و غیر خطی به ضرایب اعمال می‏شود. همچنین ترکیب دو به دو این ویژگی‏ها نیز برای تشخیص زبان استفاده شده است. بعد از استخراج ویژگی‏های مورد نظر، توسط کلاس‏بند مدل مخلوط گوسی و همچنین اعمال روشllr به عنوان یک روش پس‏پردازش ساده، برای تصمیم‏گیری مناسب‏تر از روی بردارهای امتیازات بدست آمده، شناسایی زبان مورد نظر انجام می‏گیرد. نتایج آزمایش‏ها نشان می‏دهد که ضرایب mfcc به همراه اعمال لیفتر غیر خطی و نیز ترکیب دو ویژگی می‏تواند کارایی سیستم را افزایش دهد. تاکنون روش‏های مختلفی برای شناسایی زبان گفتاری پیشنهاد شده است، که در بین همه آنها ضرایب کپسترال به درصد صحت بالاتری رسیده است. نتایج نشانگر دقت مناسب اعمال لیفتر سینوسی به ضرایب و نیز ویژگی‏های ترکیبی در تشخیص زبان می‏باشد.

منابع مشابه

انتخاب و مقایسة عملکرد ویژگی‌های بهینة استخراج‌شده از سیگنال گفتار برای تشخیص خودکار بیماری پارکینسون

در سال‌های اخیر، محققین تلاش‌های زیادی برای تشخیص بیماری پارکینسون از طریق یافتن ارتباط آن با سیگنال گفتار افراد انجام داده‌اند. همچنین پژوهش‌هایی در تعیین شدت بیماری و ارتباط آن با اختلالات صوتی انجام شده است. هدف این مقاله، ارزیابی و مقایسة توانایی دسته‌ ویژگی‌های مختلف استخراجی‌ از سیگنال گفتار، در تشخیص بیماری پارکینسون است. برای این منظور، 12 دسته ویژگی از سیگنال گفتار ارزیابی شده‌‌اند، تح...

متن کامل

تشخیص خودکار سیگنالهای موسیقی و گفتار فارسی

با توجه به رشد روز افزون محتوای چند رسانه¬ای، زمینه¬های تحقیقاتی جدیدی همچون تحلیل محتوای صوتی جهت پردازش، تشخیص و دسته¬بندی داده¬ها بر اساس محتوا معرفی شده است. مسئله دسته¬بندی سیگنال هایِ گفتار و موسیقی که زیر مجموعه¬ای از این تحقیقاتِ جدید است، توسط محققان زیادی مورد توجه و بررسی قرار گرفته است. با این وجود، تاکنون الگوریتمی که بتواند در لحظه همانند سیستمِ شنوایی انسان عمل کرده و سیگنال¬های صوت...

15 صفحه اول

شناسایی خودکار زبان گفتار با استفاده از روش های آماری

سیستم های شناسایی زبان بر دو گونه اند: سیستم هایی که از اطلاعات سطح بالای زبان مانند واج و کلمه برای شناسایی زبان استفاده می کنند و سیستم هایی که از اطلاعات سطح پایین زبان مثل زیرواج و یا ویژگی های طیفی گفتار استفاده می کنند. مشکل سیستم های با دقت بالا مانند سیستم های شناسایی زبان مبتنی بر واج که نیاز به استخراج واج دارند اینست که نیاز به دادگان آوانویسی شده برای آنها وجود دارد و با توجه به این...

15 صفحه اول

بهبود نرخ تشخیص احساس از روی گفتار با استفاده از تفکیک جنسیتی

تشخیص احساس از روی سیگنال گفتار یکی از شاخه‌های نسبتاً جدید در پردازش گفتار می‌باشد که می‌تواند در تعامل انسان و روبات نقش مهمی ایفا کند. در این مقاله ضمن استفاده از دو نوع ویژگی طیفی جدید به منظور افزایش نرخ بازشناسی به بررسی تاثیر جنسیت گویندگان در تشخیص احساس پرداخته شده است. ویژگی‌های یاد شده با استفاده از روش‌های پردازش تصویر، از تصویر طیف‌نگاره سیگنال گفتار استخراج می‌شوند . در این تحقیق ب...

متن کامل

تشخیص لهجه های زبان فارسی از روی سیگنال گفتار با استفاده از روش های استخراج ویژگی کارآمد و ترکیب طبقه بندها

Speech recognition has achieved great improvements recently. However, robustness is still one of the big problems, e.g. performance of recognition fluctuates sharply depending on the speaker, especially when the speaker has strong accent and difference Accents dramatically decrease the accuracy of an ASR system. In this paper we apply three new methods of feature extraction including Spectral C...

متن کامل

استخراج ویژگی‌های مبتنی بر مدل‌سازی خطی تراژکتوری گفتار جاسازی شده در فضای بازسازی شده فاز برای سیستم بازشناسی گفتار

تحقیقات اخیر نشان می‌دهد که تظاهرات غیرخطی و آشوبی سیگنال گفتار می‌تواند در حوزة فضای بازسازی شده فاز (RPS) مطالعه شود. تئوری جاسازی برمبنای محورهای تأخیری، ابزار مناسبی برای بررسی تراژکتورهای گفتاری در RPS است. تاکنون از مشخصه‌های تراژکتورهای گفتاری به ندرت در سیستم‌های کاربردی بازشناسی گفتار استفاده شده است. از اینرو در این مقاله  روش استخراج ویژگی جدیدی براساس پارامترهای مدلسازی خطی مبتنی بر...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

دانشگاه تربیت معلم - تهران - دانشکده مهندسی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023